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摘 要 : [目的 /意义 ] 技 术 关联 分 析 不 仅 有 助 于 科技 管理 部 门 做 好 规划 布局 .企业 机 构 在 技术 研发 方面 强 优 补 短 ,还 能 吉 
助 科研 人 员 选 择 技术 创新 方向 和 路 径 。[ 方法 /过程 ] 提 出 一 种 基于 科技 文献 文本 分 析 构 建 问 题 -技术 矩阵 并 用 
于 发 现 技术 关联 的 方法 。 首 先 ,提取 文献 中 研究 问题 及 对 应 技术 ,形成 问题 -技术 给 阵 ; 然 后 ,利用 技术 相似 度 进 
行 技术 项 合并 聚 类 以 应 对 数据 稀 下 性 问题 ,进而 分 析 建立 技术 之 间 的 关联 ;最 后 ,进行 实验 以 验证 该 方法 的 可 行 
性 。[ 结果 /结论 ] 从 文献 中 的 研究 问题 -方法 天 阵 出 发 对 技术 间 关 系 进行 归纳 和 总 结 , 提 出 一 种 自动 化 建立 技术 
之 间 的 关联 关系 的 方法 ,可 以 有 效 辅助 发 现 技 术 关联 关系 ,如 直接 竞争 关系 、 合 作 关系 、 间 接 竞争 关系 和 合作 关系 
等 。 本 研究 是 面向 科技 文献 的 技术 关联 发 现 与 应 用 的 探索 性 研究 ,研究 结果 可 为 科技 创新 研究 与 管理 提供 参考 。 
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和 .科技 创新 可 以 促进 新 产品 ,新 服务 和 新 商业 模式 
IDE” ,是 经 济 长 期 增长 的 重要 源泉 之 一 。 当 前 面 
| 儿 衣 的 科技 变革 和 产业 变革 ,全 球 科技 创新 竞争 日 趋 
激烈 。 随 着 中 国 科技 术 平 的 不 断 提高 ,我 国 与 世界 发 
廊 疾 家 的 差距 在 许多 领域 正在 逐步 缩小 ,部 分 领域 其 
至 导 经 处 于 领先 地 位 。《 中 国 战略 性 新 兴 产业 发 展 报 
告 ? 本 提 到 我 国 战略 性 新 兴 产业 的 创新 必须 要 向 基础 
性 创新 ,引领 性 创新 转型 ,要 加 强 前 上 脆性 基础 研究 .应 
用 性 基础 研究 ,突出 关键 共性 技术 ,前沿 引领 技术 、 现 
代 工 程 技 术 和 颠覆 性 技术 创新 中 。 分 析 技 术 之 间 的 关 
联 关系 有 助 于 了 解 相 关 技术 的 发 展 脉络 ,辅助 选择 技 
术 创新 方向 及 路 径 ,对 于 政府 科技 管理 .企业 机 构 技术 
研发 以 及 个 人 科技 创新 选 题 都 有 重要 意义 。 

科技 文献 是 分 析 技术 关联 的 重要 信息 资源 与 依据 。 
基于 科技 文献 内 容 分 析 建立 研究 问题 和 技术 之 间 的 关 
联 关系 是 科技 情报 分 析 的 一 项 重要 任务 。 科 研 人 员 需 
要 不 断 阅读 相关 领域 科技 文献 ,才能 了 解 所 在 领域 研究 
工作 前 沿 进 展 。 海 量 科技 文献 记录 了 科技 发 展 历史 中 


绝 大 多 数 的 研究 问题 .技术 方法 和 实验 结果 。 科 研 工作 
者 需要 及 时 了 解 科技 文献 作者 用 什么 技术 解决 什么 问 
题 得 到 什么 结论 ,建立 研究 问题 及 技术 发 展 脉络 ,形成 
研究 领域 态势 理解 。 科 技 文献 摘要 蕴含 主要 的 研究 结 
论 , 由 于 篇 幅 所 限 缺 少 研究 过 程 详细 信息 ,而 科技 文献 
正文 包含 具体 过 程 ,相关 研究 和 实验 部 分 包含 解决 研究 
问题 的 相关 技术 及 结果 比较 分 析 , 可 以 用 于 挖掘 技术 之 
间 的 关联 。 面 对 已 存在 的 海量 科技 文献 以 及 持续 新 发 
表 的 科技 文献 ,传统 的 人 工 全 文 阅读 文献 方式 日 益 难 以 
应 对 科技 文献 信息 过 载 问题 ,迫切 需要 借助 人 工 智能 等 
先进 信息 技术 快速 获取 并 分 析 了 解 科技 文献 内 容 。 

本 文 从 科技 文献 中 抽取 研究 问题 和 技术 词语 构建 
问题 — 技术 矩阵 ,进而 分 析 发 现 技 术 之 间 的 关联 关系 ， 
为 技术 发 展 趋势 预测 黄 定 基础 。 研 究 成 果 将 有 助 于 科 
研 人 员 开 展 技术 创新 及 应 用 研究 ,还 有 助 于 科研 管理 
者 了 解 技术 研究 现状 、 发 展 脉络 和 最 新 态势 ,科学 制定 
发 展 战略 规划 并 正确 选择 技术 路 径 。 


2 相关 研究 
科技 文献 调研 能 够 帮助 科研 人 员 了 解 领域 发 展 状 
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况 以 及 发 展 趋势 。 科 技 文 献 研究 正在 从 以 元 数据 研究 


联 。 陈 卫 静 等 ”以 某 技术 领域 的 关键 词 共 现 网 络 为 


为 主 向 深入 科技 文献 内 容 分 析 及 应 用 研究 发 展 。 吴 江 
宁 等 ”基于 管理 科学 领域 核心 论文 分 析 论 文中 的 题 
H .摘要 ,关键 词 和 发 表 时 间 等 信息 ,利用 LDA 模型 提 
出 了 科技 论文 的 时 序 主 题 链 构建 方法 。 王 佳 琪 等 ” 通 
过 研究 科技 文献 元 数据 建立 科研 事件 的 语义 链接 以 形 
成 科研 事件 网 络 支撑 科技 情报 分 析 。 张 昱 等 ”对 科技 
文献 中 的 元 数据 和 文本 内 容 进 行 分 析 , 构 建 了 科技 文 
献 的 语义 关联 网 络 ,支持 科技 信息 的 语义 浏览 与 检索 。 
王 艳 艳 等 ”对 科技 文献 中 的 摘要 进行 分 析 , 构 建 问 题 
-方法 矩阵 来 探索 科技 文献 研究 内 容 新 颖 性 评估 方 
法 ,辅助 科技 查 新 应 用 。J. Li 等 ”从 摘要 中 进行 信息 
抽取 并 利用 Author-Conference-Topic 模型 构建 学 术 社 
IE o 
技术 功效 矩阵 默认 为 专利 功效 矩阵 ” ,通过 专利 
次 井 反映 的 主题 技术 方案 和 主要 技术 功能 之 间 的 特征 
来 揭示 技术 和 功效 二 者 的 关系 ” ,将 技术 领域 的 
渍 手段 与 对 应 实现 的 技术 功效 种 类 构成 矩阵 mm 。 
捷 本 词 是 专利 组 件 名 称 、 技 术 流程 .技术 方法 名 称 W 
及 的 设备 材料 名 称 等 … ,通常 出 现在 专利 名 称 或 摘要 
C 避 中 ;功效 词 是 专利 实施 后 所 能 表示 的 性 能 、 用 途 、 


国 竺 等 ,通常 出 现在 专利 摘要 发 明 改 进 等 字段 中 [ 。 


VAULT 提出 了 基于 SAO 结构 和 词 向 量 的 专利 技 
术 暑 效 图 构建 方法 ,为 技术 功效 图 的 自动 化 构建 提供 


研究 载体 ,通过 分 析 某 一 技术 在 整个 网 络 中 的 位 置 和 
角色 ,发 现 技 术 间 的 依存 关系 、 互 补 关 系 、 控 制 关系 。 
黄 斌 首先 从 专利 角度 分 析 技 术 间 的 关联 形式 为 直接 联 
系 和 间接 联系 “ ,之 后 又 进一步 围绕 技术 关联 的 影响 
和 结构 及 其 关系 测度 三 个 方面 ”对 技术 之 间 的 关联 
进行 研究 ,在 技术 关联 影响 分 析 方 面 ,将 技术 关联 影响 
类 型 划分 为 直接 关联 影响 和 间接 关联 影响 以 及 无 关联 
影响 类 型 ;在 技术 关联 测度 方面 区 别 了 技术 之 间 的 对 
称 和 不 对 称 关联 。 杨 冬 敏 “ 从 四 个 维度 将 技术 关联 
分 为 12 类 ,是 目前 已 知 分 类 较为 详尽 的 分 类 框架 ,但 
是 对 于 技术 关联 分 类 发 现 只 停留 在 人 工 阶段 。 目 前 大 
多 数学 者 从 专利 \ 企 业 角 度 对 技术 关联 进行 研究 ,一 项 
技术 经 常 与 其 他 技术 结合 实现 特定 功能 。 

通常 技术 条 目 表现 为 单词 或 者 短语 ,为 减少 技术 
分 析 的 数目 可 以 将 技术 项 合并 。 王 燕 鹏 ” 利用 动态 
主题 模型 方法 构建 完整 的 科研 机 构 研 究 主题 分 布 及 演 
化 流程 。 李 勇敢 ”改进 了 杰 卡 德 相似 系数 以 及 杰 卡 
德 距 离 在 共 现 分 析 中 的 不 足 ,提出 了 相对 技术 相似 度 
和 相对 技术 关联 度 的 概念 。 黄 晓 斌 等 ”利用 向 量 余 
弦 相 似 度 和 平方 欧式 距离 两 种 相似 度 的 标准 对 通讯 技 
术 领 域 进行 聚 类 分 析 。 包 翔 等 ”尝试 将 概率 潜在 语 
义 分 析 运 用 到 专利 文本 的 标 引 中 ,为 技术 主题 聚 类 提 
供 了 一 种 新 的 思路 。 汪 锦 霞 等 ”对 主题 词 进行 聚 类 


IT 


RIA, RR X OR PE RT DU FATER E DE 
Weder goce gl" ”、 分 析 技术 机 会 ”等 。 

"三 对 于 技术 关联 性 目前 没有 一 个 标准 的 定义 ,不 同 
学 芭 根 据 其 研究 背景 对 技术 关联 性 有 不 同 的 理解 。 栾 
春 娟 等 从 可 计量 的 意义 上 将 其 定义 为 在 一 个 特定 
技术 体系 或 技术 领域 内 ,一 种 技术 类 型 与 其 他 技术 类 
型 相关 联 的 数量 和 程度 。 丰 雷 等 ”从 产业 集群 方面 
认为 技术 关联 性 指 技术 之 间 的 相互 交叉 ,联动 影响 的 


展现 技术 发 展 的 脉络 细节 。 

技术 关联 关系 已 有 相关 研究 对 技术 关联 的 分 类 大 
多 较为 笼统 ,如 强 关 联 、 弱 关联 , 少 有 研究 关注 技术 间 
的 具体 关联 形式 。 目 前 已 知 分 类 最 详尽 的 技术 关联 分 
类 框架 采用 的 是 人 工 标 注 方式 耗 时 长 且 主 观 性 强 , 因 
此 本 文 尝试 从 研究 问题 角度 切入 自动 发 现 科 技 文 献 中 
技术 之 间 的 关联 关系 。 


3 构建 问题 — 3567848 PE 


关系 。 姜 红 '” 从 技术 系统 的 角度 认为 技术 关联 性 是 
站 转 移 技术 与 当地 其 他 产业 技术 的 交叉 影响 关系 。P. 
Hofmann 等 认为 文本 技术 特定 语料库 之 间 的 相似 性 
可 以 表明 技术 之 间 的 相关 性 。 

对 技术 关联 分 类 标准 主要 有 从 技术 关联 对 企业 或 
产业 发 展 的 影响 技术 间 关 联 程 度 的 测度 以 及 从 研究 
对 象 如 专利 出 发 进行 分 类 。 冯 秀珍 等 ”从 技术 用 途 
角度 将 技术 分 为 直接 关联 、 间 接 关 联 和 关键 关联 ,之 后 
通过 分 析 技 术 关 联 定义 了 五 种 技术 群 形态 以 此 来 把 握 
当前 技术 趋势 ,判断 技术 发 展 前 景 。 丰 雷 ” 从 产业 集 
群 方面 认为 企业 间 的 技术 关联 包括 纵向 关联 和 横向 关 


3.1 相关 概念 

本 文中 ,研究 问题 (question ) 指 科技 文献 针对 的 研 
究 问 题 。 技 术 (technology ) 指 为 了 解决 研究 问题 所 提 
出 的 技术 。 问 题 - 技术 矩阵 ( question-technology ma- 
trix, QTM) 指 以 研究 问题 和 技术 为 两 个 维度 构建 的 抢 
阵 , 用 于 描述 研究 问题 和 技术 之 间 的 对 应 关系 。 技 术 
关联 指 以 研究 问题 为 纽带 而 形成 的 技术 之 间 的 关系 。 
杨 冬 敏 将 技术 关联 分 为 12 类 ,从 技术 应 用 角度 分 有 竞 
争 关系 和 互补 关系 ,从 技术 体系 结构 分 有 包含 关系 。 本 
研究 尝试 自动 化 发 现 上 述 技术 关联 ,依据 研究 问题 与 技 
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术 之 间 的 对 应 关系 发 现 技术 之 间 的 关联 ,具体 分 为 直接 
竞争 关系 ,间接 竞争 关系 和 合作 关系 和 包含 关系 。 

直接 竞争 关系 是 指 如 果 两 个 或 两 个 以 上 的 技术 都 
解决 同一 个 问题 , 则 两 个 或 两 个 以 上 技术 之 间 为 直接 
苑 争 关 系 。 图 1(1) 中 技术 1 和 技术 2 为 直接 苑 争 关 

合作 关系 是 指 如 果 两 个 或 两 个 以 上 的 技术 都 解决 
不 同 的 问题 ,但 是 它们 之 间 通 过 组 合共 同 解 决 某 一 个 
问题 , 则 两 个 或 两 个 以 上 技术 之 间 存 在 合作 关系 。 图 
1(2) 中 技术 3 和 技术 4 为 合作 关系 。 

间接 竞争 关系 是 通过 合作 关系 体现 的 ,如 果 两 个 
或 两 个 以 上 技术 通过 合作 可 以 解决 某 个 问题 ,同时 又 


cC» (1) 直接 竞争 关系 
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3.2 问题 — 技术 矩阵 构建 及 降 维 方法 

构建 问题 - 技术 矩阵 是 技术 关联 发 现 的 基础 。 不 
同 技术 之 间 可 能 存在 多 种 关联 ,以 研究 问题 为 纽带 可 
以 将 技术 及 其 关联 形成 技术 关联 网 络 。 科 技 文献 中 ， 
研究 问题 和 技术 通常 出 现在 科技 文献 的 摘要 (ab- 
stract) , JT ZH (introduction ) , 相关 研究 (related works ) 和 
实验 (experiments ) 等 章节 部 分 。 

2 是 基于 科技 文献 构建 问题 - 技术 矩阵 的 流程 
图 ,具体 步骤 如 下 : 

科技 文献 集合 D = {d ,0 e ,di| ,其 中 天 为 科 
技 文献 的 数量 ,上 >0。 对 科技 文献 文本 进行 分 句 、 大 小 
写 转换 处 理 , 构 成 科技 文献 句子 集合 S = ls 5，…… 


有 其 他 技术 可 以 解决 该 问题 ,那么 该 技术 与 这 两 个 或 
两 个 以 上 技术 之 间 形 成 间接 竞争 关系 。 图 1(3 ) 中 技 
术 3 和 技术 8 .技术 4 和 技术 8 也 为 间接 竞争 关系 。 

包含 关系 是 指 如 果 两 个 或 两 个 以 上 的 技术 合并 成 
一 项 技术 或 者 是 聚 成 一 个 技术 类 ,那么 合并 后 的 技术 
或 者 技术 类 与 这 两 个 或 两 个 以 上 技术 形成 包含 关系 。 
包含 关系 的 推理 规则 如 下 , T, T,, T, T, T, T, 
其 中 7 T, 可 以 是 单独 技术 点 或 技术 群 ,a 表示 技 
术 之 间 的 包含 关系 。 图 1(4) 中 技术 类 T, 包含 技术 5 
和 技术 6, 技术 类 7, 包含 技术 类 T, ,技术 7, 则 技术 类 
T, 也 包含 技术 5 和 技术 6。 


问题 6 


子 图 (2) 合作 关系 


FA (3) 间接 竞争 关系 


数据 收集 | | | EEE 
ERARE | C l | 
1 ! i Y 5 
Y | |o | C EmA " 
年 代 划分 (技术 列表 ) | | = 
上 = mE 
摘要 提取 研究 问题 抽取 | | (| 词性 标注 f 
DX | 奸 
CERLE ) [cam 
天 小 写 转换 


s,| ,n 为 分 句 的 数量 ,n >0。 

从 每 句 中 s, 抽取 问题 与 技术 ,构成 技术 集合 了 = 
人 UI ,研究 问题 集合 0 = | gq1 ,gs，…… ,9) 上， 
其 中 x 为 技术 数量 ,y 为 研究 问题 数量 ,x >0,y >0。 
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构建 x * y 阶 问题 -技术 和 矩阵 QTM,QTM(x,y) =1 
表示 技术 i 可 以 解决 问题 q; QTM (x,y) =0 则 表示 技 
术 不 能 解决 问题 4,。 

技术 词 和 研究 问题 的 确定 以 及 矩阵 单元 项 的 填充 
是 问题 - 技术 矩阵 构建 的 难点 。 已 有 研究 大 多 用 关键 
词 或 主题 词 来 代表 文献 所 用 技术 ,主题 词 表 达 技 术 点 
的 粒度 较 大 。 本 研究 通过 技术 列表 匹配 的 方式 抽取 技 
术 词 ,而 技术 列表 由 领域 专家 整理 而 成 ,与 关键 词 相 比 
能 够 更 准确 的 描述 技术 ,与 主题 相 比 表达 的 粒度 更 小 。 
科技 文献 中 摘要 是 结构 化 的 ,表达 形式 较为 规范 且 具 


有 一 定 的 规则 ,因此 本 研究 采用 基于 模板 匹配 的 方式 
来 抽取 摘要 中 的 问题 。 在 问题 -技术 和 矩阵 构建 时 需 对 
科技 文献 的 摘要 进行 扫描 分 析 , 当 技术 词语 与 问题 词 
语 在 同一 名 时 ,本文 假定 该 技术 可 以 解决 这 个 问题 ,在 
和 矩阵 单元 项 填充 为 1 ,否则 为 0。 

以 英文 科技 文献 为 例 , 对 研究 问题 的 描述 模式 梳 
理 如 表 1 所 示 ,根据 研究 问题 在 句子 中 出 现 位 置 不 同 ， 
将 研究 问题 的 模板 分 为 两 大 类 , 共 23 个 模板 。 由 于 模 
板 归 纳 总 结 受 语料库 限制 ,模板 库 需 要 结合 语料库 内 
容 进 行 更 新 维护 。 


表 1 问题 模板 及 样 例 


类 型 模板 样 例 (AAAI 数据 集中 统计 所 得 ) 
类 型 1 [Ttjo (. * ?) issue To alleviate the sparsity issue 


(. +?) (islare) (. * 7) issues? \b 


deal with (. * ?) problems? Wb 


problem 
tackle the problems? Vb (. * 2) $ 
(. * 7) (islare) important (tolfor) (. * ?) $ 
(. +?) Chaslhavelhad) become (. * ?) topics? Vb 
. * ?) (haslhavelhad) drawn (. * 7) attention 
. x ?) (haslhavelhad) been investigated 


( 
( 
(. x?) Chaslhavelhad) attracted (. * ?) research 
(. * ?) becomes? Vb (. * ?) tasks? Vb 

( 


. * 7) plays? Vb (. * ?) role 


202304.00458v1 


(. * 7) becomes? Vb (. * ?) problems? Wb 


solve (. * 7) problems? Vb 
the problems? Vb of (. +?) $ 


study (. * ?) problems? Wb 


chinaXiv 


(. +?) (islare) (. +?) task 


considers? Vb (. * 7) problems? Wb 


fined set 
类 型 2 propose (. *?) to (. *2) $ 


(. 3 ?) task for (.  ?) $ 


works 
(. +?) impact (. +?) $ 


solve (. * 7) problems? Vb (. +?) $ 


the level of granularity is still a critical issue 


Thus these methods cannot deal with the data sparsity without commonly rated items ( DS-WO-CRI) 


we also tackle the problems arising from noise and variation in microblogging texts 

Image localization is important for marketing and recommendation of local business 

How to efficiently share the underlying information and knowledge 

Detection of overlapping communities has drawn much attention 

Top-N recommender systems have been investigated widely both in industry and academia. 
Sentiment classification on Twitter has attracted increasing research in recent years 
location-based social networks ( LBSNs) becomes a significant task 


what causes traffic accident and early alarms for some possible ones will play a critical role on plan- 


ning effective traffic management 


the number of traffic accidents have significantly increased globally over the past decades and be- 


come a big problem for human society 

We hypothesize that most poker games can be solved as a pattern matching problem 
we address the problem of personalized next Point-of-interest ( POI) recommendation 
We study the Maximum Weighted Matching problem in a partial information setting 


The design of the best economic mechanism for Sponsored Search Auctions (SSAs) is a central task 


in computational mechanism design/game theory 


We consider the following problem in which a given number of items has to be chosen from a prede- 


we propose a deep convolutional neural network architecture, MUST-CNN to predict protein properties. 


we study a challenging task for integrating users". information from multiple heterogeneous social net- 


Their presence in user homepage stream of news aggregator sites may adversely impact user experience 


But existing online hashing methods still cannot solve two essential problems; efficient updating of 


hash codes and analysis of cross-modal correlation 


[Aa] (C. * ?) question (. « ?) $ 


A natural and well-studied question is the tournament fixing problem ( TFP) : given the set of all 


pairwise match outcomes 


problem for (. s 7) $ 


初始 构建 的 问题 — 技术 矩阵 特征 维度 高 ,特征 向 
量 稀 玻 ,不 利于 技术 关联 的 发 现 与 分 析 , 因 此 本 文通 过 
合并 技术 项 目 来 降低 矩阵 的 稀 朴 性 。 通 过 合并 技术 项 
和 问题 项 ,形成 新 的 n* m 阶 问题 — 技术 矩阵 QTM' , 
(n>0,m>0)。 合 并 遵循 如 下 规则 ,假设 技术 T, VT, 


in| 


it is a much more complex problem for imperfect information games 


可 以 合并 ,并 且 合 并 后 的 技术 为 了:: 

DUR QTM (i, ,j) 20, QTM(i,,j) =0, 则 合并 后 
的 QTM?’ (i,,n) =0; 

DUR QTM (i, ,j) 20, QTM (i,j) =1, 则 合并 后 
的 QTM’ (i.,n) =1; 
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国 如 果 QTM Ci, j) 2 1,0TM Ci, 7) =0, 则 合并 后 
的 QTM?’ (i,,n) =1; 

@ 如 果 QTM (i, j) =1,QTM(i,,j) =1, 则 合并 后 
的 QTM’ (i,,n) =i; 

同样 地 遵循 如 下 问题 合并 原则 ,假设 问题 0,、0， 
可 以 合并 ,并 且 合 并 后 的 问题 为 0，.: 

DAR QTM (ij, ) 20, QTM (ij) =0, 则 合并 后 
lis QTM?’ (m,j.) =0; 

DWF QTM ij, ) 20, QTM (i,j,) =1, 则 合并 后 
的 QTM’ (m,j.) =1; 

国 如 果 QTM (i,j,) 21, 07M (ij) =0, 则 合并 后 
的 QTM’ (mj) =1; 

@ 如 果 QTM(i,j,) =1,QTM(i,j,) =1, 则 合并 后 
的 rQOTM’ (m,j.) =1; 
生 降 低 算 阵 稀 政 性 具体 可 分 为 两 步 :首先 ,科技 文献 
rp Bj 1f 提 到 含有 包含 意义 的 词 ( 如 include , contain , 
es 


目 似 度 矩 阵 ,通过 层次 聚 类 ,进行 技术 条 目 合并 ， 
进 地 步 发 现 技术 之 间 的 关联 。 
@ 利 用 word2vec 将 技术 词 与 或 短语 转换 成 词 向 量 ， 
向 量 间 的 夹 角 余弦 值 计算 两 两 技术 间 的 相似 度 ， 
构建 技术 相似 度 矩 阵 。 假 设 word2vec 转换 的 技术 向 量 


出 


XX. w, w, eerie 4183) sts = (ww, DO et ;20 ) ,在 
> FS 
[1 + T 
> < nO qq | gj |a|! qd: | q 
e st INNEN NEMINEM NS 
t " 
c | elaklar | hl 
- “区 区 本 DETE 
l PI -A 13—3 rr a a a =p A Tees b. E 
M ens tts 0 1c 0 0 [jo 0 0 
L— + 
(S) veneni" | || mars i "me a Fead FeR 
T 1 
ti | 0 01 0 1d 1 0 
t 
t 0 0!| 9 "E 0 1 
pasce erac 
问题 -技术 矩阵 QTM 
图 3 


向 量 空间 模型 中 ,ti ,t, B RE f AR SAEI HEAR t,t 的 
相似 度 ,相似 度 立 值 在 0 — 1. 之 间 , 值 越 大 则 两 个 技术 
的 相似 性 越 大 ,如 公式 (1) 所 示 。 

( T, T, ) = 


cos (0) = 


VECLOT iui, 


2 Wi; * 05; 


d Edabg * SÈ (w) 
4 基于 问题 -方法 矩阵 发 现 技 术 关 联 


科技 文献 调研 主要 需求 场景 包括 :四 明确 知道 竺 
解决 的 问题 ,需要 了 解 到 解决 该 问题 的 技术 有 哪些 ; 
回想 对 某 个 技术 进行 深入 了 解 ,需要 知道 该 技术 可 以 
解决 哪些 问题 ,以 及 该 技术 是 如 何 演化 的 。 技 术 关联 
的 发 现 有 助 于 发 现 科研 发 展 脉 络 ,如 通过 分 析 技 术 关 
联网 络 的 节点 度数 可 以 发 现 当前 研究 问题 的 研究 热 
度 , 可 以 了 解 当前 研究 的 前 沿 技 术 。 

图 3 是 问题 - 技术 矩阵 聚 类 前 后 对 比 图 ,矩阵 
QTM 中 虚线 表示 可 以 合并 的 技术 或 问题 项 目 ,矩阵 
OTM 中 的 虚线 表示 合并 后 的 技术 或 问题 项 目 。 图 4 
是 聚 类 前 后 技术 关联 网 络 图 ,其 中 圆圈 节点 表示 技术 
点 或 技术 群 , 和 矩形 表示 研究 问题 , 顶 圆 表示 合并 后 的 技 
术 或 问题 项 目 , 若 矩 阵 中 0TM(%,y) =1, 则 在 技术 关 
联 图 中 技术 + 指向 问题 v 。 


公式 (1) 


1 
TQ qı m | Qn-1 q 
t t 
elt et oublie Mee ieu sius 
E> rna | mm &I$]! 
leder uere um IDEST P GE IUS P= i 1 
t4, ts 0 10 0 [oie 0 0 
4 十 + 
m2 n ue 1 TOI [EPIS ascia 
LU 1 
tsi | 0 oil 1d [pes j 0 
alolofa j ola 


问题 — ARAE PER 2E BI AN EE 


4 聚 类 前 后 技术 关联 对 比 
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竞争 关系 是 解决 同一 个 问题 而 提出 的 不 同 技术 ， 
竞争 关系 的 发 现 有 利于 科研 人 员 对 研究 问题 所 用 的 技 
术 进行 梳理 ,在 原 有 技术 上 进行 选择 和 创新 来 解决 某 
个 问题 ;另外 当 两 个 或 者 多 个 技术 之 间 存 在 竞争 关系 
时 ,可 以 通过 某 些 手段 将 这 些 技术 进行 融合 ,可 能 解决 
更 多 问题 ,从 而 进行 技术 创新 。 由 图 3 的 问题 - 技术 
矩阵 QTM ,根据 算法 自动 化 发 现 :技术 和 六 可 以 同 
时 解决 问题 g1 ,认为 技术 4 和 1 是 直接 竞争 关系 , 同 
HEREA t usu REG 可 以 同时 解决 问题 qu y DUI EAR t, 
6 LL UBL WEB EL ECHOS RR S EORR UU 
现 使 原本 孤立 的 技术 之 间 产 生 了 关联 ,为 解决 新 间 题 提 
供 了 新 的 思考 方向 ,科研 人 员 可 以 将 不 同 技术 之 间 进 行 
合理 的 组 合 ,从 而 产生 新 的 功效 解决 新 的 问题 。 由 问题 
HARE QTM ,根据 算法 自动 化 发 现 ,技术 4 和 4 一 
超 网 挥 作用 共同 解决 问题 9, ,那么 技术 1 和 1 之 间 是 合 
ERR HER t, 与 技术 4 构成 间接 竞争 关系 ,同时 技术 
OER n 也 形成 间接 竞争 关系 。 包 含 关系 的 发 现 使 


得 要 术 具有 被 蔡 代 洪 在 可 能 性 ,辅助 科研 人 员 进 行 颠覆 
疏 奸 术 的 发 现 与 研究 。 由 问题 - 技术 和 矩阵 QTM 可 看 
HEBR t, 可 以 解决 问题 4， 和 ,技术 可 以 解决 问题 
a CB a, , 原 本 是 两 个 孤立 的 技术 ,通过 技术 项 目 合并 (由 
HAD- BORER OTM 可 看 出 ) ,将 技术 已 和 请 合并 成 
BOR U MARR T WARR nR BARR 


以 下 是 直接 竞争 关系 发 现 的 算法 描述 : 
算法 名 称 :directcompetition 

输 扩 :问题 技术 矩阵 Question-Technology Matrix 
输出 = 直接 竞 争 技术 列表 directcompetition, list 

过 程 3 


Question list rowÜ. quetions 


Col, value context 
For i, ,ol in rou, quetions do : 
For i, „v, in context[ 1:] do : 
If v, 21 then t«—cell, value ,t append in dt, list 3B [Vg 75 N A 
为 1 的 行列 值 
End for 
If length(dt list) > 1 then 
For d, ,dv, in dt list do : 


For d, ‚dv, in dt list do : 
If d, <d, then dv, , dv; append in d. value 
If d. value not in directcompetition, list then d. value append 
in directcompetition. list 
End for 
End for 
End for 


Return directcompetition, list 


5 实验 


5.1 数据 集 

有 研究 表明 ,专利 文献 滞后 于 期 刊 论文 一 年 ,期 刊 
论文 滞后 于 会 议论 文 一 年 ” ,会 议论 文具 有 新 颖 性 、 
及 时 性 等 特点 ,因此 本 文选 取 会 议论 文 作为 实验 数据 
以 便 及 时 发 现 技术 发 展 动 向 。AAAI 会 议 汇集 了 全 球 
最 顶尖 的 人 工 智 能 领域 专家 学 者 ,研究 成 果 是 人 工 智 
能 界 的 研究 风向 标 来 源 之 一 ,数据 具有 权威 性 且 容 易 
获取 。 本 文采 用 2016 -2020 年 AAAI 会 议 发 表 的 论文 
为 数据 集 ,在 Web of Science 核心 合集 中 以 AAAI 为 会 
议 名 称 , 时 间 范 围 限 定 在 2016 - 2020 年 进行 检索 , 共 
检索 出 4 772 篇 文献 (检索 时 间 为 2021 年 3 月 15 日 )。 
5.2 问题 -技术 矩阵 构建 

对 获取 的 文献 首先 要 进行 预 处 理 ,之 后 分 两 步 分 
析 技 术 之 间 的 关联 。 中 提取 出 文本 中 问题 和 技术 , 研 
究 问题 的 抽取 式 根 据 模板 匹配 得 到 的 ,技术 的 抽取 依 
赖 技术 列表 (技术 列表 来 源 于 https://www. ctolib. 
com/ jiqizhixin-ai-terminology-page. html ) , 对 提取 的 问题 
技术 进行 数据 处 理 , 将 缩写 与 全 称 规范 化 为 “| 全称]” 
形式 ,如 将 [ Long Short-Term Memory] 和 [LSTM ] 规 范 化 
为 [ Long Short-Term Memory ] ,用 于 构建 问题 — BAR 
VF QTM ;GO 利用 技术 相似 度 和 矩阵 和 层次 聚 类 构建 合并 
后 的 问题 -技术 和 矩阵 QTM’ , 

对 4772 篇 文献 中 的 摘要 字段 进行 分 句 , 共 得 到 
12 369 句 。 表 2 是 根据 总 结 出 的 23 个 问题 模板 在 数据 
集中 抽出 的 问题 数量 ,不 同 模板 抽取 出 的 问题 数目 相 
差 较 大 , 其 中 模板 propose (. *?) to (. *?) $, 
(. x?) (islare) (. * ?) task 和 the problems? Vb of 
C. o8 2) $ JHDBCRIS HB R8 TR] H c e. Ahh A HE FI [9] 
题 .技术 进行 整理 ,技术 共 459 个 ,抽取 出 的 问题 共 2 
493 个 ,最 终 得 到 459 * 2439 的 问题 - 技术 矩阵 ,矩阵 
可 视 化 结果 见 图 5。 其 中 白色 节点 代表 技术 ,灰色 节 
点 代表 研究 问题 。 可 以 看 出 ,初始 的 问题 - 技术 矩阵 
中 数据 非常 稀 芍 。 某 些 类 似 技 术 只 解决 某 个 问题 ,很 
少 出 现 多 个 技术 解决 不 同 问题 ,矩阵 可 视 化 结果 呈现 
围绕 某 个 问题 而 抱团 的 态势 ,不同 技术 直接 联系 较 少 ， 


如 learn fashion attribute, landmark detection , cross-do- 


main fashion retrieval, body shape and size based fashion 
suggestion 等 技术 只 能 解决 问题 Visual fashion analysis 
而 不 能 解决 其 他 问题 ,分 析 产 生 的 原因 是 对 于 某 篇 科 
技 文献 ,该 文献 的 作者 只 提 到 作者 想 解决 问题 的 技术 
而 很 少 提 及 该 技术 能 否 解决 其 他 问题 。 节 点 的 大 小 表 
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示 该 问题 或 技术 是 当前 研究 热点 ,如 73 为 技术 adap- 
tive resonance theory 可 以 解决 the local similarity rela- 
tionships derived from the affinity matrix 等 问题 。 

表 2 问题 模板 抽出 问题 的 数量 
ESOO BE "I 


1 [Tt]o(. * ?) issue 179 
2 (.*7) Cislare) (. * ?) issues? Vb 4l 
3 deal with (. * ?) problems? Wb 19 
4 tackle the problems? Vb (. * ?) $ 15 
5 (. +?) Cislare) important (tolfor) (. * ?) $ 30 
6 (. +?) Chaslhavelhad) become (. * 7) topics? Wb 6 
7 (. +?) Chaslhavelhad) drawn (. * ?) attention 13 
8 (. +?) Chaslhavelhad) been investigated 7 
9 (. +?) Chaslhavelhad) attracted (. * ?) research 12 
10 (.. 7) becomes? Vb (. * 7) tasks? Wb 16 
qu 
"a (. 3 ?) plays? \b (. * ?) role 101 
CO (. +?) becomes? Wb (. * ?) problems? Wb 16 
M solve (. * ?) problems? Wb 156 
the problems? \b of (. +?) $ 336 
e study (. * ?) problems? Wb 122 
5 (<x?) (islare) (. * ?) task 378 
e considers? Vb (. * ?) problems? Wb 100 
(ip ) propose (. * 2) to (. * 2) $ 781 
my (. x?) task for (. +?) $ 23 
(. +?) impact (. +?) $ 150 
24 = solve (. * ?) problems? Vb (. *?) $ 92 
[Aa] C. * ?) question (. * ?) $ 58 


BE problem for (. +?) $ 54 
CQ  ———— ———— 
和 多 由 于 抽取 出 的 问题 和 技术 数量 较 多 ,构建 出 的 和 玫 


Tr 


阵 较 为 庞大 ,后 续 技 术 之 间 关联 发 现 较为 复杂 ,因此 本 
O 


图 5 问题 


注 :白色 圆圈 为 研究 技术 ,灰色 为 研究 问题 


文采 用 2017 年 数据 进行 研究 ,得 到 294 * 406 的 问题 
技术 矩阵 并 进一步 合并 技术 项 目 。 利 用 word2vec 将 技 
术 转 换 成 词 向 量 之 后 ,计算 向 量 之 间 的 余弦 值得 到 对 
称 的 技术 相似 度 和 矩阵 ,如 图 6 所 示 , 层 次 聚 类 过 程 中 ， 
经 过 多 次 筛选 阀 值 和 人 工 检验 ,最 终 选 定理 想 冰 值 为 
0.71 , 共 分 为 65 类 。 

5.3 ”技术 关联 发 现 

根据 实验 结果 ,直接 竞争 关系 有 36 585 对 , 合 

关系 有 1 586 对 ,包含 关系 有 347 对 。 部 分 技术 关系 见 
表 3, 从 表 3 中 可 以 看 出 一 个 技术 可 以 解决 多 个 问题 ， 
如 Latent Dirichlet Allocation 可 以 解决 问题 The Sparsity 
和 Mitigating The Vanishing Gradients Problem ,多 个 技术 
也 可 共同 发 挥 作用 解决 一 个 问题 ,如 Deep Learning, 
Gated Attention-Based Recurrent Networks 和 Word Em- 
bedding 可 以 解决 Multi-Task Learning ( Mtl) 。 直 接 竞 
争 关 系 中 , Latent Dirichlet Allocation 与 Reinforcement 


Learning 与 Independent Component Analysis Latent 等 技 
NÉ R Et 2 ve PR R; E Dn] PE v e OS TR rh, Adaptive 
Resonance Theory 和 Deep Learning, Gated Attention- 
Based Recurrent Networks 等 技术 形成 间接 竞争 关系 ;在 
合作 关系 中 , Deep Learning 和 Gated Attention-Based 
Recurrent Networks , Word Embedding 等 形成 合作 关系 ; 
在 包含 关系 中 ,Classifier 包含 K-Nearest Neighbours Al- 
gorithm ,类 Cl 包含 Quadratic Programming 和 Dynamic 
Programming 等 技术 ,类别 C5 包含 Performance Measure 
和 Parameter Estimation 等 技术 。 


-技术 关联 
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图 6 技术 相似 度 和 矩阵 ( 部 分 ) 


RI 技术 关系 


技术 关系 


技术 1 


技术 1 对 应 研究 问题 


技术 2 


技术 2 对 应 研究 问题 


接 竞 争 关系 
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casting; Learn Context Representation To 
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Impact Of Noisy Data 


The Sparsity; Region-Level Demand Fore- 
casting; Learn Context Representation To 
Improve Text Classification; Alleviate The 


Impact Of Noisy Data 


The Sparsity; Mitigating The Vanishing Gra- 
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Predict Morphological Boundaries 


Latent Dirichlet Allocation 


Latent Dirichlet Allocation 


Extreme Learning Machine 


Recurrent Neural Net- 


works 


Receiver Operating Char- 


The Sparsity ; Mitigating The Van- 
ishing Gradients Problem 


The Sparsity ; Mitigating The Van- 
ishing Gradients Problem 


Alleviate The Impact Of Noisy 
Data 


Mitigating The Vanishing Gradi- 


ents Problem 


Predict Morphological Boundaries 


acteristic 
间接 竞争 关系 Adaptive Resonance Theory Multi-Task Learning (Mtl) Deep Learning Multi-Task Learning ( Mtl) 
Adaptive Resonance Theory Multi-Task Learning ( Mtl) Word Embedding Multi-Task Learning ( Mtl) 
r : $ Gated Attention-Based . . 
Adaptive Resonance Theory — Multi-Task Learning ( Mil) Multi-Task Learning ( Mil) 
Recurrent Networks 
Gated Attention-Based 
合作 关系 Deep Learning Multi-Task Learning ( Mil) Multi-Task Learning ( Mil) 
Recurrent Networks 
Word Embedding Multi-Task Learning ( Mil) Deep Learning Multi-Task Learning ( Mil) 
Gated _ Attention-Based Re- . : 
Multi-Task Learning ( Mil) Word Embedding Multi-Task Learning ( Mil) 
current Networks 
Gated Convolutional Net- . 
" A Related Architecture Memory Networks A Related Architecture 
works 
Leam Depth Features Combining 
K-Nearest. Neighb Al- Local Weakly Supervised Traini 
包含 关系 Classifier Symmetric Positive Defined (Spd) Matrix D e E MS: 


gorithm 


From Patches Followed By Global 
Fine Tuning With Images 


120 


ChinaXiv 合 作 期 刊 


徐 珍 珍 ， 张 均 胜 , 刘 文 斌 . 科技 文献 中 技术 关联 自动 发 现 方法 研究 [省 . 图 书 情报 工作 ,2021 ,65(20) :113 - 122. 


( 续 表 3) 
技术 关系 技术 1 技术 1 对 应 研究 问题 技术 2 技术 2 对 应 研究 问题 

Approximate The Pareto Frontier; Integrate Approximate The Pareto Frontier; 
Semantic Attributes With Trajectories For ! : Integrate Semantic Attributes With 
类 别 C1 . . Dynamic Programming : . f 

Cross-View People Tracking; Convex Quad- Trajectories For Cross-View Peo- 

ratic Programming ple Tracking 

Approximate The Pareto Frontier; Integrate 
类 别 Cl Semantic Attributes vit Trajectories For Convex Quadratic Pro- Cosves Quadra: Progamming 

Cross-View People Tracking; Convex Quad- gramming 

ratic Programming 

The Class Imbalance ; Solve Traffic Flow 
m Forecasting Problem ; Drastically Speed Up The Class Imbalance ; Solve Traf- 
类 别 C5 . . : Performance Measure . . 

Hlta Using A Technique Inspired By The fic Flow Forecasting Problem 

Advances In The Method Of Moments 

The Class Imbalance; Solve Traffic Flow Drastically Speed Up Hlta Using 
m Forecasting Problem ; Drastically Speed Up I A Technique Inspired By The Ad- 
类 别 C5 Parameter Estimation 


Hlta Using A Technique Inspired By The 


vances In The Method Of Mo- 


Advances In The Method Of Moments ments 


二 构建 问题 - 技术 矩阵 的 方法 能 够 发 现 技术 之 间 的 
交 商 ,从 实证 分 析 结果 来 看 ,直接 竞争 关系 36 585 对 , 合 
KRH 1586 对 ,包含 关系 有 347 对 ,从 结果 来 看 直接 
六 验 关系 最 多 ,合作 关系 最 少 ,其 次 是 包含 关系 ,结果 分 
六 肛 平 衡 ,可 能 的 原因 是 :从 问题 出 现 开 始 , 不 同学 者 为 

5 攻 决 该 问题 提出 了 不 同 技术 ,直接 竞争 关系 最 多 是 必 
然 % 而 合作 关系 和 包含 关系 少 是 因为 本 文 研究 对 象 是 科 
捷 刘 献 中 摘要 部 分 ,文章 作者 对 于 摘要 主要 提出 自己 的 


í 


技术 , 少 有 提 及 该 方法 技术 的 发 展 进程 以 及 其 他 技 


路 。 与 之 前 从 专利 ,企业 角度 对 技术 关联 进行 研究 的 工 
作 相 比 , 本 文 从 科技 文献 中 的 研究 问题 角度 对 技术 间 关 
系 进 行 了 归纳 和 总 结 ,自动 化 发 现 技术 间 关 系 发 现 基 于 
问题 -技术 和 矩阵 的 技术 关联 关系 分 析 在 一 定 程度 上 可 
以 辅助 科技 创新 管理 与 工作 。 本 项 研究 是 面向 科技 文 
献 的 技术 关联 发 现 与 应 用 的 探索 性 研究 ,研究 结果 有 助 
于 提高 科技 创新 研究 与 管理 的 工作 效率 。 

受 时 间 和 能 力 所 限 ,本 文 研究 还 存在 一 些 不 足 , 未 
来 工作 展望 如 下 :中 技术 .问题 的 抽取 自动 化 水 平 有 待 


术 状 况 。 同 时 间 题 - 技术 和 抢 阵 的 稀 朴 性 本 文采 用 的 是 
层 淆 隧 类 进行 降 维 ,在 一 定 程度 上 满足 本 文 需求 ,然而 
hls Dee ee 
留 慰 始 技 术 保 证 细 粒 度 技术 ,这 个 方面 需要 在 后 续 研究 
中 深入 思考 。 在 技术 关联 网 络 的 应 用 方面 ,可 考虑 加 入 
时 闻 元 素 构 建 时 序 技术 关联 网 络 ,描述 不 同时 期 技术 关 
联 情况 ,揭示 技术 关联 的 产生 ,发展 和 消亡 的 过 程 ,分 析 
技术 前 沿 热点 与 发 展 趋势 ;了 解 技 术 研究 现状 ,发展 脉 
络 和 最 新 态势 ,科学 制定 发 展 战 略 规划 ,规避 科研 投资 
风险 并 正确 选择 技术 路 径 ;等 等。 


6 结语 


本 文 提出 了 一 种 基于 问题 -技术 和 矩阵 的 科技 文献 
中 技术 关联 发 现 方法 。 通 过 提取 科技 文献 中 的 研究 问 
题 和 技术 形成 初始 问题 -技术 和 矩阵 ,为 降低 矩阵 数据 稀 
下 性 对 技术 条 目 进行 聚 类 ,然后 分 析 发 现 技术 间 存 在 直 
REPR ,间接 竞争 关系 和 合作 关系 。 通 过 实验 验证 
技术 关联 发 现 方法 的 有 效 性 ,实验 以 AAAI 会 议 集 为 研 
究 对 象 ,从 科技 文献 中 研究 问题 -方法 和 矩阵 出 发 对 技术 
间 关 系 进 行 了 归纳 和 总 结 ,探索 自动 化 建立 技术 之 间 的 
关联 关系 的 方法 ,为 技术 关联 自动 发 现 提供 一 种 新 思 


Hg 


提高 ,技术 抽取 受 限于 技术 词 表 的 构建 ,覆盖 率 和 新 颖 
性 有 竺 改进 ,问题 模板 库 的 更 新 维护 等 问题 需要 结合 
语料库 不 断 更 新 维护 ,未 来 工作 可 考虑 将 新 技术 术语 
发 现 和 技术 词 表 结合 的 方法 满足 技术 监测 新 颖 性 需 
求 ;@ 当 前 研究 中 仅 总 结 了 四 种 技术 关联 关系 发 现 方 
法 ,然而 实际 应 用 中 技术 关联 种 类 更 多 ,未 来 工作 可 学 
试 分 析 发 现 更 多 技术 关联 关系 ,并 通过 推理 推断 提高 
自动 化 构建 水 平 ;@ 技 术 关 联网 络 构建 是 在 AAAI 会 
议论 文集 进行 实验 ,所 得 出 的 结论 受 限 于 数据 集 的 范 
围 , 尚 未 在 医药 化 学 ,传统 石油 等 更 多 行业 进行 实证 ， 
后 续 工作 可 考虑 扩大 数据 集 规模 及 领域 范围 ,验证 扩 
展 本 文 所 提 方 法 的 通用 性 。 
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TE Automatically Discovering Associations Among Technologies in Scientific Literature 
Xu Zhenzhen Zhang Junsheng Liu Wenbin 
Institute of Scientific and Technical Information of China, Beijing 100038 

Abstract: | Purpose/significance | Technology association analysis can help government to make science and tech- 
nology strategies and plans, and help enterprises to make up shortcomings for development, and help researchers to select 
research directions. | Method/ process | This paper proposed an approach to discover technology associations and relations 
by constructing a problem-technology matrix based on scientific literature. First, research questions and technologies were 
extracted from contents of scientific literature to formulate a question-technology matrix; and then, technologies were calcu- 
lated to cluster for reducing data sparsity. Finally, experiments showed the effectiveness of our proposed approach. | Re- 
sult/conclusion | Starting from the question-technology matrix in literature, this paper summarizes the associations between 
technologies, and explores methods of automatically establishing the relationship between technologies, which can effec- 
tively help to discover the relationship between technologies, such as direct competition relationship, cooperation relation- 
ship, indirect competition relationship and cooperation relationship. This research is an exploratory research on the discov- 
ery and application of technology association for scientific literature. The research results will help to improve the efficiency 
of scientific and technological innovation research and management. 
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